什么 样 的 评论 更 容易 获得 有 用 性 投票 
一 以 亚马逊 网 站 研究 为 例 
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摘要 : 【 目的 ] 购物 网 站 评论 系统 中 的 投票 机 制 有 利于 帮助 消费 考 筛 选 出 高 质量 评论 。 本 文 以 评论 有 用 性 投票 
数 为 研究 对 象 , 探讨 什么 样 的 评论 更 容易 获得 有 用 性 投票 。[ 方法 】 以 信息 采纳 理论 和 负面 偏差 理论 为 基础 ， 基 
于 亚马逊 购物 网 站 中 的 12 393 条 手机 评论 数据 , 结合 文本 分 析 与 零 膨胀 负 二 项 回归 分 析 方 法 ， 从 评论 者 信和 度 、 

评论 信息 质量 、 评 论 极 性 三 个 方面 探究 评论 有 用 性 投票 影响 因素 。[ 结果 ] 研究 结果 表明 , 评论 者 有 用 性 、 评 论 
信息 量 、 评 论 回 复数 、 极 端 评 分 、 评 论文 本 消极 倾向 对 评论 有 用 性 投票 数 具 有 积极 正 向 影响 。 评 论 者 发 表 评论 
数 、 评 论 者 是 否 确认 购买 对 评论 有 用 性 投票 数 有 负 向 影响 。[ 局 限 】 仅 以 手机 这 一 搜索 型 产品 为 研究 对 象 , 研究 


结果 欠缺 普 适 性 。[ 结论 ] 本 文 研究 成 果 对 于 改善 电子 商务 评论 排序 系统 具有 借鉴 意义 。 
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关键 词 : 在 线 评论 ”评论 有 用 性 
分 类 号 : G203 


1 引 Ë 


用 户 生 成 内 容 (User Generated Content，UGC) 是 
Web 2.0 时 代 的 一 个 重要 产物 , 并 随 着 微 博 、 微 信 、 论 
坛 等 社交 平台 的 出 现 而 逐渐 扩大 了 影响 力 。 购 物 网 站 
中 的 在 线 评论 是 UGC 中 的 一 个 重要 内 容 , 对 于 消费 
者 购买 决策 过 程 具有 辅助 作用 。 然 而 , 购物 网 站 中 的 
在 线 评论 存在 数量 庞大 且 质 量 参 差 不 齐 等 问题 中 。 为 
了 帮助 消费 者 对 评论 质量 进行 评估 并 筛选 出 高 质量 评 
论 , 亚马逊 、 淘 宝 、 京 东 等 购物 网 站 推出 了 评论 有 用 
性 投票 机 制 。 例 如 ,亚马逊 在 每 一 条 评论 后 向 消费 者 
提问 “该 条 评论 是 否 对 你 有 用 ? ”。 消 费 者 回答 “是 ” nu 
评论 有 用 投票 数 加 1， 消 费 者 回答 “和 否 ” 有 用 投票 数 不 
增加 ,总 投票 数 加 1。 每 一 条 评论 后 都 有 一 个 有 用 性 评 
估 指 标 ， 例 如 “10 人 中 有 9 人 认为 此 评论 有 用 ”。 许 多 
研究 者 以 评论 有 用 性 投票 数 除 以 评论 总 投票 数 的 值 为 
评论 有 用 性 衡量 指标 , 进一步 探究 什么 样 的 评论 才 是 


h IS 


消费 者 认为 有 用 的 评论 , 即 评论 有 用 性 影响 因素 上 9。 
fijan, Liu 等 四 以 IMDB 上 的 影评 数据 为 例 , 采用 回归 
分 析 方 法 ， 以 评论 有 用 性 为 因 变 量 , 探究 了 评论 者 的 
专业 程度 、 评 论 书写 的 模式 、 评 论 发 表 时 间 对 评论 有 
用 性 的 有 影响。Mudambi 等 外 以 亚马逊 上 6 种 商品 (包括 
搜索 品 和 体验 品 两 种 ) 的 评论 投票 数 大 于 2 的 评论 数据 
为 研究 对 象 , 利用 tobit 回归 模型 ， 研 究 评论 评分 、 评 
论 长 度 对 评论 有 用 性 的 影响 ,并 进一步 探究 了 商品 类 
型 对 这 种 影响 的 调节 作用 ,从 信息 诊断 性 这 一 角度 对 
结果 进行 解释 。 
这 些 研 究 在 探讨 什么 样 的 评论 对 于 消费 者 来 说 有 
用 这 一 问题 上 做 出 了 许多 贡献 。 但 是 这 些 人 研究 存在 两 
个 问题 。 首 先 ， 多 数 研究 以 亚马逊 中 的 评论 有 用 性 为 
因 变 量 研究 评论 的 质量 。 这 种 衡量 模式 忽略 了 投 
票 基数 带 来 的 影响 力 。 例 如 , 评论 有 用 性 为 1 的 投票 ， 
可 以 是 “1 人 中 有 1 人 觉得 该 评论 有 用 ”, 也 可 以 是 “10 
人 中 有 10 人 觉得 该 评论 有 用 ”。 这 两 种 计算 方式 的 结 
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果 虽 然 一 样 , 但 是 显然 后 者 的 质量 和 影响 力 高 于 前 者 ， 
而 许多 前 人 研究 忽略 了 这 一 点 。 其 次 , 这 些 研 究 在 探 
讨 评论 有 用 性 时 ， 所 采用 的 评论 都 是 有 投票 的 评论 ， 
对 于 没有 投票 的 评论 因为 无 法 计算 评论 有 用 性 而 排除 
在 样本 之 外 。 然 而 有 的 商品 评论 集中 , 超过 50% 的 评 
论 并 没有 投票 山 。 本 研究 采用 的 12 393 条 评论 数据 集 
中 , 也 有 高 达 69% 的 评论 没有 投票 , 这 些 没有 投票 的 
评论 并 不 都 是 没有 用 的 。 只 包含 有 投票 评论 的 样本 将 是 
一 个 非 随机 样本 , 采用 该 样本 进行 回归 会 产生 误差 品 。 

为 避免 这 两 个 问题 ,同时 体现 评论 对 于 消费 者 的 
有 用 性 价值 ， 本 文 以 评论 有 用 性 投票 为 研究 对 象 。 评 
论 有 用 性 投票 一 方面 体现 了 消费 者 对 评论 的 认可 度 ， 
另 一 方面 体现 了 评论 的 高 影响 力 。 因 为 评论 投票 数 越 
高 ,代表 赞成 这 一 观点 的 消费 者 越 多 , 那么 该 观点 所 
影响 的 消费 者 数 越 多 。 因 而 , 评论 有 用 性 投票 这 一 指 
标 相 对 评论 有 用 性 增加 了 对 投票 人 数 的 考量 。 那 么 ， 
什么 样 的 评论 更 容易 获得 有 用 性 投票 呢 ? 研究 这 样 一 
个 问题 , 将 有 助 于 理解 消费 者 的 投票 行为 ， 帮 助 改善 
购物 网 站 评论 投票 系统 。 本 文 以 此 为 出 发 点 ， 以 亚 马 
逊 中 的 手机 评论 数据 为 研究 对 象 , 将 有 投票 和 没有 投 
票 的 评论 都 纳入 样本 中 ， 以 评论 的 有 用 性 投票 数 为 


供与 需求 和 预期 相关 的 客观 性 信息 或 意见 的 程度 。 信 
息 源 的 可 信 性 具体 表现 为 专业 性 和 真实 性 1。 

而 关于 信息 质量 的 定义 及 度量 就 要 复杂 得 多 , 不 
同 的 学 者 给 出 了 不 同 的 答案 "4。 对 于 信息 质量 的 度 
量 , Gorla 等 ("1 认为 信息 质量 涉及 完整 性 、 准 确 性 和 及 
时 性 三 个 维度 。Filieri 等 (3 在 对 用 户 对 旅游 评论 信息 
的 采纳 研究 中 , 在 Gorla 等 的 基础 上 进一步 加 上 相关 
性 、 可 理解 性 和 增值 性 三 个 维度 探讨 在 线 评论 的 信息 
质量 。 在 本 文中 , 由 于 研究 的 情境 是 电子 商务 购物 网 
站 中 的 在 线 商品 评论 , 用户 浏 览 评论 的 目的 是 为 了 
减少 信息 不 对 称 性 从 而 做 出 购物 决策 ， 因 此 将 信息 
质量 定义 为 信息 能 够 满足 用 户 进 行 购 物 决 策 所 达到 
的 要 求 。 

在 消费 者 对 评论 进行 投票 的 情境 中 , 消费 者 对 信 
息 源 的 评估 指 的 是 对 评论 者 信息 的 评估 ， 而 信息 质量 
的 评估 主要 是 指 评论 内 容 的 评估 。 

Q) 负面 偏差 理论 

Kanouse 和 Hansonn 在 1972 年 提出 的 负面 偏差 理 
论 中 9 指出 ,相同 强度 的 负面 事情 (例如 ,不 开心 的 想 
法 、 情 绪 、 事 件 等 ) 相 对 于 中 立 或 者 积极 的 事情 ， 对 一 
个 人 的 心理 状态 有 着 更 强烈 的 影响 四。 也 就 是 说 ,对 


变量 , 采用 零 膨胀 负 二 项 回归 模型 对 评论 有 用 性 投票 
影响 因素 进行 探究 。 


2 理论 基础 与 假设 


2.1 理论 基础 

(1) 信息 采纳 理论 

为 了 更 好 地 解释 消费 者 判断 评论 是 否 有 用 的 行为 
过 程 , 笔者 引入 Sussman 和 SiegalU? 提出 的 信息 采纳 
模型 , 这 也 是 前 人 关于 评论 有 用 性 研究 中 最 常用 的 理 
论 模 型 中 。 因 为 消费 者 在 对 评论 进行 投票 的 过 程 实 
际 上 是 评估 评论 信息 是 否 有 用 ,进而 决定 是 否 采纳 的 
过 程 。 该 模型 认为 消费 者 决定 对 一 条 信息 是 否 采纳 的 
过 程 中 , 通常 会 从 两 个 角度 考虑 , 一 是 信息 源 的 可 信 
BE, 二 是 信息 的 质量 中。 即 消费 者 从 信息 质量 和 信息 源 
可 信 度 两 个 角度 对 信息 进行 权衡 以 后 ， 则 会 判断 该 条 
言 息 是 否 对 自己 有 用 ,进一步 地 确定 是 否 采 纳 该 信息 ， 
从 而 做 出 态度 或 行为 的 改变 。 

言 息 源 的 可 信和 度 是 指 由 于 信息 源 具 有 和 用 户 信息 
需求 主题 相关 的 知识 或 经 验 而 使 用 户 相信 信息 源 能 提 


于 同等 情感 强度 的 正面 信息 和 负面 信息 ,负面 信息 对 
于 消费 者 的 行为 和 认 知 的 影响 强 于 正面 信息 。 进 一 步 
地 , 负面 偏差 对 于 消费 者 的 决策 具有 影响 中 。 因 为 当 
个 体 在 获得 和 损失 之 间 进 行 决 策 时 , 个 体 更 多 地 会 考 
虑 损失 。 因 而, 相 比 于 正面 评论 对 于 商品 的 肯定 ， 消费 
者 更 看 重负 面 评 论 中 的 内 容 。 因 为 负面 评论 会 传递 这 
样 一 个 信息 : 我 付 钱 购买 该 商品 将 会 产生 哪些 效用 损 
失 。 因 此 , 除了 信息 源 和 信息 的 质量 以 外 , 信息 所 包含 
的 情感 极 性 也 会 影响 消费 者 对 信息 的 采纳 。 

因此 , 本 文 从 评论 者 信和 度 、 评 论 信 息 质量 、 评 论 
极 性 三 个 角度 考察 评论 有 用 性 投票 影响 因素 。 
2. 评论 者 信和 度 

许多 研究 发 现 , 评论 者 信息 对 消费 者 对 评论 有 用 
性 的 评估 具有 显著 影响 。 前 文 指出 , 评论 者 信息 与 评 
论 有 用 性 之 间 的 关系 主要 是 从 信息 源 的 可 信和 度 这 一 视 
角 考 虑 的 。 关 于 信息 源 可 信和 度 的 度量 角度 包括 评论 者 
声誉 、 评 论 者 等 级 、 评 论 者 排名 、 评 论 者 专业 性 、 评 
论 者 历史 评论 信息 等 5%* ”1。 这 些 角 度 可 归纳 为 两 个 
方面 : 评论 者 的 专业 性 和 真实 性 。 本 文 结合 亚马逊 网 
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站 的 数据 特点 ， 对 评论 者 信和 度 的 衡量 也 从 这 两 个 方面 
展开 。 
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费 者 对 评论 内 容 的 理解 外。 英文 中 有 FRES, FOG” 
等 较 成 熟 的 文本 可 读 性 测量 方法 , 可 以 方便 地 做 文本 


亚马逊 网 站 上 提供 的 评论 者 信息 包括 评论 是 否 为 
排名 前 1 000 名 的 评论 者 、 评 论 者 历史 发 表 评论 的 有 
用 性 即 评论 者 有 用 性 (评论 者 发 表 的 所 有 评论 获得 的 
有 用 性 投票 数 除 以 总 投票 数 )、 评 论 者 发 表 的 评论 数 、 
评论 者 是 否 确认 在 亚马逊 上 购买 过 商品 。 对 于 评论 排 
名 前 1 000 名 的 评论 者 , 亚马逊 都 会 在 评论 页 上 提示 。 
而 本 文 不 采用 此 种 衡量 方式 ,因为 亚马逊 上 的 评论 者 
数量 庞大 ， 有 一 些 商 品 的 评论 中 可 能 不 包含 排名 在 前 
1000 名 的 评论 者 。 在 本 文采 集 的 12 393 条 样本 数据 
中 , 也 只 有 40 条 评论 的 评论 者 是 前 1 000 名 评论 者 ， 
采用 该 指标 并 不 合适 。 

除 评论 者 排名 外 ， 有 学 者 研究 发 现 评论 者 的 历史 
评论 信息 可 以 预测 评论 的 有 用 性 62 。Ghose 和 
Ipeiroti HRAM, XF DVD 产品 和 数码 相机 , 评论 
者 的 历史 信息 对 其 评论 有 用 性 存在 显著 影响 。 评 论 者 
的 历史 信息 反映 了 评论 者 的 评论 撰写 经 验 , 是 对 评论 
者 可 信 度 中 专业 性 的 度量 。 本 研究 认为 评论 者 有 用 性 
是 对 评论 者 所 发 表 的 历史 评论 质量 的 度量 , 评论 者 有 
用 性 越 高 , 评论 所 获得 有 用 性 投票 数 越 高 。 评 论 者 所 
发 表 的 评论 数 是 对 评论 者 的 评论 经 验 的 考察 , 评论 者 
所 发 表 的 历史 评论 数 越 多 ,其 当前 评论 所 获得 评论 有 
用 性 投票 数 将 越 高 。 因 此 本 文 提出 如 下 假设 : 

Hla: 评论 者 有 用 性 对 评论 有 用 性 投票 数 有 显著 的 正 向 
影响 。 

Hib: 评论 者 发 表 评 论 数 对 评论 有 用 性 投票 数 有 显著 的 
正 向 影响 。 

而 对 于 评论 者 信息 真实 度 的 衡量 ,本 文采 用 “ 评 
论 者 是 否 确认 购买 ”这 一 指标 ,确认 已 经 在 亚马逊 上 购 
买 商品 的 用 户 其 评论 通常 是 真实 的 ， 而 那些 没有 确认 
购买 的 用 户 其 发 表 的 评论 可 能 是 虚假 的 ， 其 信服 力 更 
低 。 因 此 本 文 提 出 如 下 假设 : 

Hlc: 评论 者 的 购买 真实 性 对 评论 有 用 性 投票 数 有 显著 
的 正 向 影响 。 

2.5 ”评论 信息 质量 

评论 信息 质量 的 好 坏 体 现在 为 消费 者 购物 决策 
提供 信息 支持 的 评论 内 容 上 。 许 多 学 者 在 对 评论 有 用 
性 的 研究 中 将 评论 内 容纳 为 影响 因素 。 其 中 评论 可 读 
性 ”和 评论 长 度 人 ”是 研究 最 多 的 两 个 变量 。 评 
论 可 读 性 是 指 评论 是 否 容易 阅读 ,这 一 指标 会 影响 消 
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可 读 性 计算 。 然 而 ， 中 文中 并 没有 成 熟 的 可 读 性 测量 
方法 ,因此 本 文 不 考虑 这 一 影响 因素 。 评 论 长 度 代 表 
评论 中 的 信息 总 量 , 越 长 的 评论 , 信息 量 越 大 , 评论 
越 有 用 外 ,但 男 一 部 分 学 者 研究 发 现 , 评论 长 度 与 评论 
有 用 性 并 不 成 正比 ,中 等 长 度 的 评论 比 过 短 或 过 长 的 
评论 更 有 用 站。 过 短 的 评论 无 法 提供 足 量 有 效 信息 ， 
过 长 的 评论 可 能 使 消费 者 失去 阅读 耐心 , 因而 这 两 种 
评论 对 消费 者 而 言 都 没有 用 中 I。 男 有 学 者 质疑 以 在 线 
评论 长 度 代表 评论 信息 量 的 方式 中 。 因 为 有 些 评论 虽 
然 很 长 , 但 是 包含 许多 无 用 信息 。 那 么 什么 才 是 有 效 
的 信息 , 什么 样 的 信息 对 于 消费 者 而 言 有 用 ? 如 果 评 
论 中 所 包含 的 内 容 能 够 集中 代表 其 他 用 户 所 反映 的 观 
点 , 那么 可 以 认为 该 条 评论 所 包含 的 信息 是 有 效 的 ， 
该 评论 对 消费 者 而 言 也 越 有 用 。 

本 研究 认为 ， 当 一 条 评论 所 包含 的 内 容 越 能 够 代 
表 其 他 评论 的 内 容 时 , 该 评论 所 包含 的 信息 量 越 高 。 
评论 所 包含 的 信息 量 越 多 , 评论 有 用 性 越 高 。 本 文采 
用 一 种 自动 文本 摘要 算法 ,对 每 个 产品 的 评论 集中 每 
条 评论 文本 所 包含 的 信息 量 进 行 评估 。 因 而 本 文 提出 
如 下 假设 : 

H2a: 评论 信息 量 对 评论 有 用 性 投票 数 有 显著 的 正 向 
影响 。 

亚马逊 网 站 允许 所 有 浏览 评论 的 浏览 者 对 评论 进 
行 回复 。 这 些 回复 包括 浏览 者 和 评论 者 之 间 的 回复 互 
动 及 亚马逊 商家 对 评论 者 在 评论 中 提出 的 问题 的 官方 
解答 。 这 些 回复 是 对 评论 文本 内 容 的 补充 ,能 够 帮助 
其 他 消费 者 进一步 加 深 对 商品 和 服务 的 了 解 ， 对 其 十 
分 有 用 。 因 而 , 本 文 认为 评论 的 回复 数 越 多 , 评论 获得 
的 有 用 性 投票 数 将 越 高 。 因 而 本 文 提 出 如 下 假设 : 

H2b: 评论 回复 数 对 评论 有 用 性 投票 数 有 显著 的 正 向 
影响 。 
2.4 评论 极 性 

前 文 指出 , 信息 的 情感 极 性 对 信息 采纳 也 具有 影 
响 。 在 以 往 评论 研究 中 ,对 于 评论 极 性 的 衡量 从 两 个 
角度 出 发 : 评论 评分 极 性 、 评 论文 本 极 性 。 评 论 评分 
的 极 性 认为 评分 过 高 或 过 低 的 评论 为 极 性 高 的 极端 评 
i6, 中 间 评 分 的 评论 为 极 性 低 的 温和 评论 外 ,这 种 评分 
的 变化 实际 上 反映 了 评论 者 态度 极 性 的 变化 。 关 于 评 


论 极 性 和 评论 有 用 性 之 间 的 关系 , 不 同 的 学 者 的 研究 
结果 有 所 差异 。 一 方面 , 中间 评 分 的 评论 由 于 能 够 更 
客观 地 表述 产品 的 优点 和 缺点 ， 因 而 更 令 人 信服 , 3B 
常会 被 消费 者 认为 更 有 用 。 例 如 , Mudambi 等 外 发 现 对 
于 经 验 型 产品 ,中 间 评 分 比 极端 评分 更 有 用 。 另 一 方 
面 ， 也 有 学 者 研究 发 现 , 相 比 于 中 间 评 分 ， 消 费 者 更 
容易 受 极端 评分 的 影响 中 。 本 研究 认为 ,在 不 考虑 记 
论 内 容 的 前 提 下 , 极端 评分 相对 于 中 间 评 分 更 能 够 吸 
引 消 费 者 的 注意 ， 因 而 能 够 获得 更 多 的 有 用 性 投票 。 
因而 提出 如 下 假设 : 

H3a: 评分 极 性 对 评论 有 用 性 投票 数 有 显著 的 正 向 影响 。 

评论 评分 仅仅 是 对 评分 极 性 的 衡量 , 并 没有 涉及 
到 评论 内 容 的 情感 极 性 。 因 而 有 学 者 利用 文本 分 析 方 
法 ,进一步 探究 了 评论 文本 中 的 积极 和 消极 产 2 HI. B 
虑 和 生气 外 、 主 客观 外 等 情感 因素 对 评论 有 用 性 的 影 
响 ， 即 评论 文本 极 性 。 本 文 将 探讨 评论 中 的 积极 情感 
和 消极 情感 对 评论 有 用 性 投票 的 有 影响。 负面 偏差 理论 
指出 ,相对 于 中 立 和 积极 信息 ,消极 信息 对 消费 者 影 
响 更 大 "站 。 因 而 本 文 提出 如 下 假设 : 

H3b: 评论 消极 情感 倾向 对 评论 有 用 性 投票 数 有 正 向 影响 。 

H3c: 评论 积极 情感 倾向 对 评论 有 用 性 投票 数 有 负 向 影响 。 

本 文 的 研究 模型 如 图 1 所 示 。 
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图 1 评论 有 用 性 投票 实证 研究 模型 
3 研究 设计 


3.4 数据 收集 
在 线 评论 的 相关 研究 多 以 英文 亚马逊 网 站 为 研究 


对 象 。 为 和 国外 研究 结果 进行 对 比 , 本 文 以 亚马逊 中 
国 网 站 中 的 评论 数据 为 研究 对 象 。 有 学 者 研究 发 现 产 
品类 型 对 消费 者 感知 评论 有 用 性 具有 调节 作用 外 。 因 
而 选取 以 往 研究 外 9 中 常用 的 搜索 品 一 一 手机 为 研究 
对 象 进行 数据 人 息 取 , 排除 了 产品 类 型 对 评论 有 用 性 的 
影响 。 利用 GooSeeker 爬 取 亚马逊 2016 年 1 月 8 日 这 
一 天 销量 排名 前 100 的 100 部 手机 评论 数据 。 为 保证 
研究 的 准确 性 , 按照 评论 ID 对 重复 数据 进行 删除 ; 同 
时 , 删除 总 评论 数 小 于 100 的 样本 。 最 后 共 得 19 NET 
机 的 12 393 条 评论 数据 。 其 中 每 条 评论 数据 包括 以 下 
内 容 : 评论 评分 ; 评论 时 间 ; 评论 文本 ; 评论 回复 数 ; 
评论 者 排名 ; 评论 者 有 用 性 ; 评论 者 发 表 评 论 数 ; 评 
论 者 是 否 确认 购买 该 商品 ; 手机 总 评论 数 ; 手机 销量 
排名 ; 评论 有 用 性 投票 数 。 
3.2 ”变量 设计 

为 了 验证 本 文 假设 , 设计 了 如 表 1 所 示 的 变量 。 
其 中 因 变 量 为 评论 有 用 性 投票 数 ， 即 认为 该 条 评论 有 
用 的 投票 的 总 数 。 自 变量 包括 评论 者 信和 度 、 评 论 信息 
质量 、 评 论 极 性 三 个 部 分 。 


变量 类 型 ”变量 名 变量 变量 解释 


"x 评论 者 获得 有 用 性 投票 数 / 
评论 者 有 用 性 。 reUse 。 评论 者 获得 的 总 投票 数 
评论 者 发 表 评论 者 已 经 发 布 的 评论 的 
评论 数 TeNum 总数 
评论 者 是 否 确认 在 亚马逊 
是 否 确认 购买 ”buyornot 上 购买 商品 (0 表示 未 确 
m 认购 买 ; 1 表示 确认 购买 ) 


reInfo ”评论 文本 所 包含 信息 量 
comment 评论 下 的 回复 总 数 
评分 与 平均 评分 差 值 的 绝 
对 值 


积极 词汇 总 数 /评论 长 度 


评论 信息 量 
评论 回复 数 
评分 极 性 


评论 积极 倾向 pos 


rateGap 


评论 消极 倾向 neg ”消极 词汇 总 数 / 评 论 长 度 
aus 评论 有 用 评论 获得 的 有 用 性 投票 
因 变 量 性 投票 数 usefulNum 总 数 


(1) 评论 者 信 度 

评论 者 信和 度 信 息 包括 评论 者 有 用 性 Geuse)、 评 论 者 
发 表 评 论 数 (reNum)、 是 否 确 认购 买 (buyornot) 三 个 变 
量 。 其 中 评论 者 有 用 性 指 评论 者 发 表 的 所 有 评论 所 获得 
总 有 用 投票 数 与 总 投票 数 的 比值 ,是 一 个 值 域 在 [0，1] 
的 数值 变量 ; 该 值 越 大 表示 该 评论 者 所 发 表 的 评论 受 
到 其 他 消费 者 认可 度 越 高 , 是 对 消费 者 已 发 表 评论 的 
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质量 的 衡量 。 评 论 者 发 表 评论 数 是 消费 者 在 亚马逊 网 
站 上 发 表 的 所 有 评论 的 数目 。 评 论 者 是 否 确认 购买 ， 
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者 对 该 评论 的 回复 总 数 。 这 些 回 复 能 够 进一步 揭露 消 
费 者 所 关心 的 问题 , 有 助 于 丰富 评论 信息 内 容 ， 提 高 


是 一 个 二 元 变量 , 0 表示 评论 者 未 确认 在 亚马逊 上 购买 
该 商品 , 1 表示 评论 者 已 确认 在 亚马逊 上 购买 该 商品 。 
Q) 评论 信息 质量 
评论 信息 质量 衡量 指标 包括 评论 信息 量 (reInfo)、 
评论 回复 数 (comment) 两 个 变量 。 对 于 评论 信息 量 的 计 
算 , 采用 基于 文本 相似 性 思想 的 LexRankP 算法 。 该 


消费 者 对 该 条 评论 有 用 程度 的 感知 。 
(3) 评论 极 性 
评论 极 性 包括 评分 极 性 (rateGap) 、 评 论 积 极 倾向 
(pos)、 评 论 消 极 倾 向 (neg)。 评 分 极 性 (rateGap) 采 用 评 
论 评分 和 商品 平均 评分 的 差 值 的 绝对 值 。 该 值 越 大 ， 
表示 该 评论 持 有 不 一 样 的 观点 ， 可 能 会 吸引 更 多 的 消 


算法 是 一 种 文本 自动 摘要 算法 ,能够 对 文档 中 每 个 句 
子 所 包含 的 信息 量 进行 评 佑 ， 从 中 抽取 出 信息 含量 最 
多 的 一 个 句子 F 4。 算法 的 基本 思想 是 : 将 每 一 个 句子 
视 作 无 向 图 G=(S，B) 中 的 节点 ， 当 句子 间 的 相似 度 大 
于 某 一 阀 值 时 ,， 则 认为 这 两 个 句子 语义 相关 并 将 它们 
连接 起 来 ; 节点 s 的 度 d 代 表 与 节点 s 相 连 的 边 的 数目 ; 
当 节 点 的 度 do 越 大 时 , 代表 与 其 关联 的 句子 越 多 , 那 
么 该 节点 就 越 重 要 ,同时 与 重要 节点 相连 的 节点 也 很 
重要 ， 而 节点 的 特征 向 量 中 心性 可 以 表征 这 一 关系 ; 
通过 计算 节点 的 特征 向 量 中 心性 , 来 表示 节点 对 于 整 
个 网 络 的 重要 程度 ， 节 点 的 特征 向 量 中 心性 越 大 , 该 
节点 就 越 重 要 ， 即 该 句子 所 包含 的 信息 量 越 大 。 因 此 
可 以 利用 LexRank 算法 计算 每 一 个 商品 评论 集中 所 包 
含 的 评论 的 信息 量 。 采 用 LexRank 算法 计算 评论 信息 
量 之 前 , 需要 计算 评论 之 间 的 文本 相似 度 。 对 于 评论 
文本 之 间 的 相似 度 , 采用 经 典 的 基于 TF-IDF 的 余弦 
相似 度 算法 中 YI。 本 研究 中 的 具体 做 法 如 下 

(构建 用 户 词典 与 停 用 词 词 表 。 其 中 用 户 词典 来 源 是 搜 
狗 语料库 中 的 手机 、 网 购 词 库 及 第 三 方 手机 评测 网 站 中 关 村 
在 线 上 关于 本 研究 所 涉及 的 手机 产品 零 部 件 的 描述 , 一共 
234 个 。 

@ 利 用 ICTCLAS 分 词 系统 Eg 对 每 一 个 商品 中 所 有 评论 
进行 分 词 处 理 ， 去掉 停 用 词 及 低频 词 ， 形 成 基于 不 同 商品 的 
TREE. 

图 计算 某 一 商品 每 一 条 评论 中 词语 的 TF-IDF 值 ， 从 而 
对 商品 的 评论 集 进 行 VSM 建 模 。 所 形成 的 矩阵 的 每 一 行 表 
示 商 品 中 的 每 一 条 评论 ， 而 每 一 行 中 的 值 是 每 一 条 评论 中 
每 一 个 词 的 TF-IDF 值 。 

@ 计 算 矩 阵 中 每 一 行 的 值 与 其 余 行 的 余弦 夹 角 值 ， 以 
其 作为 每 一 条 评论 与 商品 评论 集中 其 余 评论 的 余弦 相似 性 
值 ， 从 而 形成 评论 余弦 相似 性 矩阵 。 

@ 利 用 LexRank 算法 对 余弦 相似 性 矩阵 进行 处 理 ， 获 
得 每 一 条 评论 的 信息 量 ,用 变量 reInfo 表示 。 


评论 回复 数 (comment) 为 每 一 条 评论 下 其 他 消费 
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费 考 进行 有 用 性 投票 后。 评论 文本 的 积极 和 消极 情感 
倾向 的 计算 , 采用 评论 文本 中 积极 或 消极 词汇 的 数量 
除 以 评论 长 度 的 方式 请 小。 本 文 利用 台湾 大 学 的 
NTUSD 情感 极 性 词典 中 识别 评论 文本 中 的 积极 和 消 
极 词汇 。 考 虑 到 评论 文本 中 包含 一 些 表 达 情 感 的 网 络 
用 语 ( 例 如 “ 赞 ”"“ 坑 驳 ” 等 ) 以 及 关于 手机 的 情感 词汇 
(例如 “ 瑕 竟 品 *"、“ 推 荐 *"、“ 值 得 购买 "等 ), 而 NTUSD 
中 不 包含 这 些 词 汇 因此 需要 补充 加 入 。 关 于 这 一 部 
分 词汇 的 补充 , 利用 ICTCLAS 系统 对 所 有 样本 数据 
进行 分 词 59, 统计 高 频 词 汇 从 词 频 大 于 10 的 词汇 中 
筛选 高 频 情 感 词汇 ; 两 位 实验 室 人 员 分 别 阅读 1 000 
条 长 度 最 长 评论 , 选 出 情感 词 ， 而 后 对 比 情感 词 选择 
结果 ,对 情感 词典 进一步 补充 ; 最 后 重组 成 基于 手机 
网 购 评论 的 NTUSD 情感 词典 ,通过 ICTCLAS 分 词 带 
及 NTUSD 情感 词典 , 可 以 有 效 地 对 样本 数据 中 的 评 
论文 本 进行 情感 词汇 识别 与 情感 计算 。 

3.3 MW ik 

为 验证 本 模型 中 假设 ,采用 零 膨胀 负 二 项 回归 模 
型 。 采 用 该 模型 的 原因 主要 有 三 个 : 

(D 因 变 量 评论 有 用 性 投票 数 是 一 个 计数 变量 ， 
并 不 是 一 个 连续 变量 ， 且 不 呈正 态 分 布 , 不 满足 普通 
最 小 二 乘 回 归 模 型 的 基本 要 求 ， 因 而 采用 泊 松 回归 和 
负 二 项 回归 等 计数 模型 更 合适 ; 

(2) 因 变量 均值 为 1.7、 方 差 为 189, 方差 远大 于 
均值 ,数据 较为 分 散 ， 此 种 情况 下 采用 泊 松 回归 模型 
拟 合 效果 不 理想 中 ， 因 而 采用 负 二 项 回归 模型 ; 

(3) 因 变 量 零 值 比例 高 达 69%， 而 零 膨 胀 负 二 项 
回归 模型 能 够 在 数据 分 散 、 零 值 多 的 情况 下 进行 更 好 
HEPI, 

零 膨 胀 负 二 项 模型 通常 由 两 部 分 组 成 : 决定 因 变 
量 是 否 发 生 的 逻辑 回归 模型 ， 该 模型 对 因 变 量 中 的 零 
值 进行 解释 ; 负 二 项 回归 模型 ， 该 模型 对 因 变 量 的 值 
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的 大 小 进行 解释 。 消 费 者 对 评论 进行 投票 时 ， 并 没有 
阅读 所 有 的 评论 。 因 此 有 的 评论 的 有 用 性 投票 数 为 0, 
并 不 是 因为 该 评论 没有 用 ， 而 可 能 是 该 评论 并 没有 被 
消费 者 所 阅读 。 如 果 直 接 采 用 负 二 项 回归 模型 会 产生 
嵩 差 ， 因 此 需要 对 因 变 量 中 的 零 值 进行 解释 。 
本 研究 将 评论 发 表 时 间 (time) 、 商 品 总 评论 数 
(comNum)、 商 品 排名 (rank) 作 为 解释 变量 , 纳入 零 膨 胀 
模型 中 。 评 论 投 票数 是 否 为 零 值 受 两 方面 因素 影响 ， 
是 消费 者 的 投票 习惯 ,如果 消费 者 的 投票 习惯 越 为 
RA, 那么 评论 被 投票 的 几率 越 高 ; 二 是 评论 的 被 阅 
读 量 ,如果 评 论 的 被 阅读 量 越 少 , 那么 评论 投票 数 为 
零 值 的 可 能 性 越 大 。 时 间 有 助 于 评论 投票 习惯 养 成 ， 
消费 者 参与 网 上 互动 的 行为 将 随 着 时 间 推 移 越 来 越 强 
烈 ， 因 此 将 评论 已 经 发 表 的 时 间 (time) 作 为 零 膨 胀 
子 。 同 时 商品 总 评论 数 越 多 , 平均 每 条 评论 被 阅读 的 
几率 越 小 , 被 投票 的 几率 都 会 减少 ; 商品 排名 越 靠 前 ， 
代表 商品 热门 程度 越 高 , 那么 单位 时 间 内 相对 于 其 他 
商品 ， 其 评论 的 浏览 量 更 高 ， 因 而 平均 每 条 评论 被 投 
票 的 可 能 性 越 高 。 
本 研究 中 的 零 膨 胀 负 二 项 模型 如 下 所 示 : 
逻辑 回归 模型 : 


usefulINum=Bltime+B2comNum+B3rank+B4keyNumst+te, 
usefulNum=0 


负 二 项 回归 模型 : 


usefulNum=B1lreUse+B2reNum+B3buyornot+B4reInfo+BS 
comment+B6rateGap+B7pos+B8neg+gs,usefulNum=1, 2, 3… 


其 中 逻辑 回归 模型 是 对 因 变 量 有 用 性 投票 数 为 0 
进行 解释 ; 负 二 项 回归 模型 是 本 文 的 主要 研究 对 象 ， 
其 解释 因子 由 评论 者 信和 度 、 评 论 信息 质量 、 评 论 极 性 
三 大 部 分 组 成 。 


4 数据 分 析 与 结果 


4.1 描述 性 统计 分 析 

各 变量 的 描述 性 统计 分 析 结 果 如 表 2 所 示 。 其 中 
评论 有 用 性 投票 数 最 小 为 0， 最 大 为 755,， 有 用 性 投票 
数 分 布 较 离散 。 对 有 用 性 投票 数 进行 频数 统计 ,发现 
其 呈现 左 偏 分 布 。 约 69% 的 评论 有 用 性 投票 数 为 0, 29 
28% 的 评论 有 用 性 投票 数 为 1 到 10 之 间 , 仅 有 2% 的 
评论 有 用 性 投票 数 大 于 10。 同 有 用 性 投票 数 一 
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样 ,评论 者 发 表 的 评论 数 也 呈现 较 大 的 离散 现象 。 虽 
然 评论 者 发 表 评 论 数 的 均值 达到 10, 但 是 约 有 51% 的 
评论 者 只 在 亚马逊 发 表 过 1 到 2 次 评论 , 这 表明 大 部 
分 评论 者 在 亚马逊 的 评论 经 验 不 丰富 。 
表 2 描述 性 统计 分 析 结 果 

类 别 变量 名 ”平均 值 ” 标 准 差 最 大 值 ” 最 小 值 


usefulNum 1.70 13.77 755.00 0.00 
"" " reUse 0.37 0.38 1.00 0.00 
评论 者 信 度 

reNum 9.91 27.73 781.00 1.00 

buyornot 0.97 0.17 1.00 0.00 
PR ,, relnfo 0.29 0.25 1.00 0.00 
评论 信息 质量 

comment 0.19 0.81 44.00 0.00 

rateGap 1.01 0.81 3.41 0.03 
评论 极 性 pos 0.02 0.03 0.31 0.00 

neg 0.01 0.02 0.18 0.00 

time 417.72 | 265.92 973.00 0.00 
零 膨 胀 因子 。 rank 3420 20.01 9700 1.00 

comNum 652.26 2495.1] 6011.00 100.00 


各 变量 之 间 的 相关 系数 如 表 3 Bron, 变量 time 和 
comNum 相关 系数 达到 0.78， 表 明 两 者 呈现 正 相 关 ， 
根据 变量 对 模型 拟 合 优 度 贡 献 程度 舍弃 变量 
comNum， 而 选择 变量 time; 其 余 自 变量 之 间 的 相关 
系数 均 小 于 03, 表明 自 变 量 之 间 不 存在 共 线 性 问题 。 
4.2 回归 分 析 结 果 与 讨论 

为 更 好 地 体现 评论 者 信和 度 、 评 论 信息 质量 、 评 论 
极 性 三 个 部 分 的 自 变 量 对 模型 的 解释 作用 。 除 包含 全 
部 变量 的 模型 外 ,， 另 加 入 两 个 模型 进行 对 比 。 其 中 模 
型 1 是 只 包含 有 关 评 论 者 信 度 一 类 自 变 量 的 零 膨 胀 负 
二 项 模型 , 模型 2 是 包含 有 关 评论 者 信和 度 和 评论 信息 
质量 两 类 自 变 量 的 零 膨 胀 负 二 项 模型 ， 模 型 3 是 包含 
评论 者 信 度 、 评 论 信息 质量 、 评 论 极 性 三 类 自 变量 的 
零 膨 胀 负 二 项 模型 。 模 型 回归 结果 如 表 4 Br, 发 现 
模型 3 的 对 数 似 然 值 的 绝对 值 比 模型 1 和 模型 2 都 要 
小 , 表明 加 入 评论 信息 质量 和 评论 极 性 两 类 变量 能 够 
提高 模型 的 拟 合 优 度 。 因 此 ， 本文 以 模型 3 的 结果 进 
行 分 析 。 同 时 , 将 模型 3 中 的 零 膨 胀 负 二 项 模型 与 包 
含 模型 3 中 所 有 变量 的 负 二 项 模型 进行 Vuong 检验 。 
检验 结果 表明 本 研究 采用 零 膨 胀 负 二 项 模型 比 负 二 项 
模型 拟 合 效果 更 好 。 
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RI 变量 相关 系数 
reUse  reNum buyornot reInfo comment rateGap pos neg comNum time rank 
reUse 1.00 0.22 —0.06 0.01 0.08 0.07 0.00 0.02 —0.06 —0.01 —0.05 
reNum 0.22 1.00 —0.05 0.00 0.00 —0.06 0.00 —0.01 0.02 0.00 0.02 
buyornot | —0.06 —0.05 1.00 0.02 —0.07 —0.10 0.02  -0.05 0.07 0.01 —0.06 
reInfo 0.01 0.00 0.02 1.00 0.04 —0.06 -0.05  -0.04 —0.05 —0.02 0.01 
comment 0.08 0.00 —0.07 0.04 1.00 0.08 —0.03 0.01 —0.13 —0.13 —0.07 
rateGap 0.07 —0.06 —0.10 —0.06 0.08 1.00 —0.13 0.19 0.04 —0.01 0.08 
pos 0.00 0.00 0.02 —0.05 —0.03 —0.13 1.00 —0.13 —0.08 —0.07 0.00 
neg 0.02 —0.01 —0.05 —0.04 0.01 0.19 —0.13 1.00 0.00 0.00 0.02 
comNum . -0.06 0.02 0.07 —0.05 —0.13 0.04 —0.08 0.00 1.00 0.78 0.26 
time —0.01 0.00 0.01 —0.02 —0.13 —0.01 —0.07 0.00 0.78 1.00 0.17 
rank —0.05 0.02 —0.06 0.01 —0.07 0.08 0.00 0.02 0.26 0.17 1.00 
A4 回归 分 析 结 果 
模型 1 模型 2 模型 3 
系数 P 值 系数 P 值 系数 P 值 
(Intercept) —1.598 0.000 —1.576 0.000 -2.081 0.000 
reUse 5.836 0.000 4.841 0.000 4.651 0.000 
reNum —0.006 0.000 —0.005 0.000 —0.004 0.000 
buyornot —1.445 0.000 —1.334 0.000 -1.152 0.000 
reInfo 0.451 0.000 0.630 0.000 
comment 0.476 0.000 0.441 0.000 
rateGap 0.324 0.000 
pos -2.136 0.001 
neg 2.418 0.034 
Log(theta) —0.961 0.000 —0.721 0.000 —0.640 0.000 
零 膨 胀 模型 
(Intercept) —30.124 0.000 —30.445 0.000 —30.500 0.000 
rank 0.043 0.000 0.0435 0.000 0.044 0.000 
Log(time) 4.230 0.000 4.272 0.000 4.277 0.000 
LogLike —12940 —12530 —12380 


本 文 的 膨胀 因子 系数 均 显 著 ， 说明 添加 的 膨胀 因 
子 有 效 。 这 表明 , 评论 发 表 时 间 和 商品 排名 会 影响 评 


的 系数 P 值 虽然 显著 ,但 是 系数 为 负 ， 表 明 评 论 者 发 
表 的 评论 数 对 评论 有 用 性 投票 数 有 负 向 影响 ,与 假 


论 是 否 被 投票 。 

(1) 评论 者 信和 度 

评论 者 有 用 性 Ceuse) 的 系数 为 正 且 了 值 显著 
(P<0.001), 表明 评论 者 有 用 性 对 评论 有 用 性 投票 数 有 
正 向 影响 , Hla 得 到 支持 。 评 论 者 发 表 的 评论 数 reNum 
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ix Hlb 相悖 ， 因 此 假设 Hlb 没有 得 到 支持 。 评 论 者 
发 表 的 评论 数 与 评论 有 用 性 投票 呈现 负 问 关系 ,如 
表 5 所 示 , 样本 中 约 37% 的 评论 者 是 第 一 次 评论 , 在 
其 他 变量 相同 的 情况 下 ,这 些 评论 者 的 平均 评分 极 
性 差 rateGap 值 为 1.13, 大 于 其 他 评论 者 的 rateGap 


值 0.93; 前 者 平均 评分 (3.87) 小 于 后 者 (4.24)。 表 明 第 
一 次 发 表 评论 的 评论 者 的 评论 通常 负面 偏激 ， 负 面 
情绪 促使 用 户 参 与 第 一 次 评论 ， 而 多 次 参与 评论 的 
评论 者 所 发 表 的 评论 更 为 客观 , 评论 更 为 温和 ; 负面 


k6 ”评论 者 是 否 确认 购买 与 有 用 性 投票 数 关 系 


是 否 真 实 购买 ”比率 ”平均 有 用 性 投票 数 ”评分 差 值 (评分 ) 
1 97% 1.51 1.00(4.16) 
0 3% 7.73 1.46(3.33) 


评论 相对 于 正面 评论 能 够 获得 更 多 有 用 性 投票 ， 基 
此 评论 有 用 性 投票 数 与 评论 者 发 表 的 评论 数 呈 现 负 
面 关 系 。 若 将 评论 者 有 用 性 看 作 评 论 者 发 表 评论 质 
©, Hla 得 到 支持 而 Hlb 没有 得 到 支持 的 结果 表明 ， 
评论 者 历史 发 表 的 评论 数 越 多 ,其 当前 所 发 表 的 评 
论 获得 有 用 性 投票 数 不 一 定 越 高 ; 而 评论 者 历史 发 
表 的 评论 质量 越 高 , 则 其 当前 所 发 表 的 评论 获得 

用 性 投票 数 将 越 高 。 


表 5 评论 者 发 表 评论 数 与 有 用 性 投票 数 关系 


已 发 表 评论 数 “ 比率。 平均 有 用 性 投票 数 ”评分 差 值 (评分 ) 
>1 63% 1.64 0.93(4.24) 
1 37% 1.80 1.13(3.87) 


评论 者 是 否 确 认购 买 (buyornob 系 数 为 负 且 P 值 显 
著 (P<0.001), 表明 那些 没有 确认 在 亚马逊 上 购买 商品 
的 评论 者 的 评论 相对 于 确认 在 亚马逊 上 购买 商品 的 评 
论 者 的 评论 能 够 获得 更 多 投票 , 与 假设 Hlc 相悖 , 假 
i Hlc 没有 得 到 支持 。 如 表 6 所 示 , 样本 中 约 3% 的 评 
论 者 属于 没有 确认 在 亚马逊 上 购买 商品 的 评论 者 ， 另 
外 97% 的 评论 者 属于 已 经 确认 在 亚马逊 上 购买 商品 的 
群体 。 前 者 的 有 用 性 投票 数 的 均值 为 7.73， 而 后 者 的 
均值 为 1.51。 这 表明 没有 在 亚马逊 上 确认 购买 商品 的 
评论 相 比 于 确认 购买 的 评论 能 够 获得 更 多 消费 者 的 关 
注 和 认可 。 同 时 也 表明 , 亚马逊 的 “是 否 确认 购买 " 功 
能 对 于 用 户 感知 评论 真实 性 方面 没有 影响 。 因 为 所 选 
商品 为 亚马逊 自 营 商品 , 不 会 出 现 商家 操纵 评论 的 现 
象 即 亚 意 差 评 与 好 评 现象 ,保证 了 评论 的 真实 性 。 因 
而 亚马逊 的 “是 否 确认 购买 "这 一 功能 仅 能 确认 评论 者 
的 购买 渠道 是 否 是 亚马逊 。 这些“ 没有 确认 在 亚马逊 购 
买 ?的 评论 者 , 极 有 可 能 是 在 线 下 门店 等 其 他 渠道 购 
买 商品 后 ， 再 前 往 亚马逊 撰写 评论 。 而 这 样 的 行为 需 
要 更 强 的 主动 性 , 因此 在 撰写 评论 时 会 更 认真 。 同 时 
由 表 6 可 知 ,这 一 部 分 评论 者 的 评论 表现 为 负面 偏激 ， 
因而 根据 负面 偏差 理论 及 下 文 有 关 评 论 极 性 与 评论 有 
用 性 投票 数 的 关系 可 知 , 负面 评论 相对 于 正面 评论 更 
易 获 得 有 用 性 投票 。 


Q) 评论 信息 质量 
评论 信息 量 (CeInfo) 系 数 为 正 且 P. 值 显著 (P<0.001)， 
表明 评论 信息 量 与 评论 有 用 性 投票 数 成 正比 , 评论 信 
息 量 越 多 , 评论 有 用 性 投票 数 将 越 高 , 假设 H2a 得 到 
支持 。 根 据 本 研究 对 评论 信息 含量 的 计算 , 那些 与 其 
他 评论 相似 度 越 高 的 评论 ， 其 信息 量 越 丰富 ， 即 这 些 
评论 是 对 该 产品 评论 集中 观点 的 概括 。 因 而 假设 H2a 
成 立 的 结果 表明 那些 具有 代表 性 的 观点 ， 其 受到 消费 
者 的 认可 度 越 高 ， 其 获得 的 有 用 性 投票 数 将 越 多 。 

评论 回复 数 (comment) 系 数 为 正 且 P 值 显著 , 表明 
评论 回复 数 对 评论 有 用 性 投票 具有 正 向 影响 , 假设 
H2b 得 到 支持 。 评 论 回复 数 越 多 ,能够 披露 更 多 消费 
者 所 关心 的 问题 , 进而 提高 评论 信息 的 诊断 性 。 那 么 ， 
该 条 评论 获得 有 用 性 投票 的 可 能 性 越 高 。 评 论 回复 数 
越 多 ,表明 该 条 评论 的 消费 者 关注 度 越 高 ， 因 而 获得 
的 评论 投票 数 越 多 。 

(3) 评论 极 性 

评分 极 性 (rateGap) 系 数 为 正 且 P. 值 显著 ,表明 评 
分 极 性 对 评论 投票 有 正 向 影响 ,假设 H3a 得 到 支持 。 
当 消费 者 所 发 表 的 评分 偏离 平均 评分 越 多 时 ， 即 消费 
者 观点 越 极端 时 , 该 条 评论 就 越 能 够 吸引 消费 者 进行 
有 用 性 投票 。 

评论 文本 消极 倾向 reg) 对 评论 有 用 性 投票 数 具 
有 正 向 影响 , 假设 H3b 成 立 。 评 论文 本 积极 情感 倾向 
(pos) 的 P 值 显著 且 系 数 为 负 , 假设 H3c 成 立 。 这 一 结 
果 表 明 , 消极 评论 相对 积极 评论 更 容易 获得 有 用 性 投 
票 ; 积极 词汇 比例 越 高 的 评论 ， 其 投票 数 越 少 ,表明 
积极 描述 并 不 能 吸引 用 户 投 票 。 本 文 的 研究 结果 也 与 
负面 偏差 理论 一 致 ， 即 消极 评论 相对 于 积极 评论 对 消 
费 者 的 影响 更 大 。 电 子 商务 卖家 在 对 商品 进行 宣传 的 
时 候 , 会 尽 可 能 阐述 商品 的 优点 而 不 谈 商 品 的 缺点 。 
事实 上 消费 者 在 商品 的 详情 页 , 已 经 对 于 商品 的 优点 
有 所 了 解 。 因 此 消费 者 在 阅读 评论 时 更 想 知 道 : 商家 
阐述 的 这 些 优 点 是 否 真 实 以 及 该 商品 还 有 何 缺 点 。 因 
而 负面 评论 相对 于 正面 评论 能 够 为 消费 者 提供 更 多 有 
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价值 的 信息 。 同 时 ， 有 学 者 研究 表明 , 大 部 分 在 线 评论 
都 是 积极 的 1 那么 消极 评论 在 众多 评论 中 能 够 吸 
引 更 多 消费 者 的 注意 ,从 而 可 能 获得 更 多 投票 。 
假设 验证 结果 如 表 7 所 示 。 
表 7 假设 结果 


类 别 假设 结果 


Hla: 评论 者 有 用 性 对 评论 有 用 投票 数 有 显著 。 支持 
的 正 向 影响 。 

评论 者 Hlb: 评论 者 发 表 的 评论 数 对 评论 有 用 性 投票 不 支持 

信和 度 ” 数 有 显著 的 正 向 影响 
Hic: 评论 者 的 购买 的 真实 性 对 评论 有 用 性 投 不 支持 
票数 有 显著 的 正 向 影响 。 i 

.评论 信 自 量 对 评论 性 yi DEA 

评论 H2a: 评论 信息 量 对 评论 有 j 性 投票 数 有 显著 支持 

1 的 正 向 影响 。 

质量 H2: 评论 回复 数 对 评论 有 用 性 投票 数 有 显著 p 
的 正 向 影响 。 


H3a: 评分 极 性 对 评论 有 用 性 投票 数 有 显著 的 ， 
正 向 影响 。 id 

评论 H3b: 评论 文本 消极 情感 倾向 对 评论 有 用 性 投 

极 性 ”票数 有 正 向 影响 。 
H3c: 评论 文本 积极 情感 倾向 对 评论 有 用 性 投 
票数 有 负 向 影响 。 


5 结论 与 展望 


5.1 研究 结论 与 启示 

本 文 探 究 了 一 个 以 往 在 线 评论 研究 中 较 少 涉及 的 
问题 : 什么 样 的 评论 更 容易 获得 有 用 性 投票 。 只 有 当 
评论 获得 投票 后 , 评论 投票 系统 才能 有 效 运作 。 因 此 ， 
研究 这 个 问题 是 必要 的 。 以 信息 采纳 理论 和 负面 偏差 
理论 为 基础 ， 将 有 可 能 会 影响 评论 有 用 性 投票 数 的 因 
素 分 成 评论 者 信和 度 、 评 论 信息 质量 、 评 论 极 性 三 个 大 
类 。 从 这 三 个 角度 探讨 了 什么 样 的 评论 更 容易 获得 有 
用 性 投票 , 并 以 亚马逊 网 站 中 的 12 393 条 手机 评论 为 
研究 对 象 , 利用 零 膨 胀 负 二 项 回归 模型 进行 分 析 。 

研究 结果 显示 , 在 评论 者 信和 度 信 息 方 面 , 历史 发 
表 评 论 质量 越 高 的 用 户 , 越 容易 获得 有 用 性 投票 ; 后 
时 ,第 一 次 发 表 评 论 的 评论 者 及 未 通过 亚马逊 渠道 购 
买 商品 的 评论 者 ， 其 评论 通常 负面 偏激 ， 容 易 引 起 其 
他 用 户 共 鸣 , 更 容易 获得 更 多 有 用 性 投票 。 在 评论 信 
息 质量 方面 ,回复 数 较 多 的 评论 更 能 够 吸引 消费 者 进 
行 有 用 性 投票 ; 评论 中 包含 的 信息 量 越 高 ， 对 消费 者 
而 言 越 有 用 。 在 评论 极 性 方面 , 评分 越 极 端的 评论 ， 越 
有 可 能 获得 有 用 性 投票 ; 负面 评论 相对 于 正面 评论 更 
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能 够 吸引 消费 者 进行 有 用 性 投票 。 

基于 这 些 研究 结论 ， 对 于 电子 商务 评论 系统 的 管 
理 者 提出 如 下 建议 : 

(1) 改善 评论 排序 机 制 。 本 文 的 研究 结果 表明 评 
论 者 有 用 性 及 评论 回复 数 这 些 指标 对 影响 消费 者 感 
知 评论 有 用 性 具有 正 向 影响 。 因 此 , 除了 传统 的 以 时 
间 、 有 用 性 、 综 合 排序 外 , 在 线 评论 系统 的 评论 排序 
逻辑 可 以 将 评论 者 有 用 性 、 评 论 回复 数 等 因素 也 纳入 
其 中 。 

Q) 重视 负面 评论 。 本 研究 结论 表明 消费 者 容易 
受 负面 评论 影响 。 因此 亚马逊 的 商家 需要 对 负面 评论 
进行 积极 回应 ， 消 除 其 他 消费 者 对 商品 和 服务 质量 
的 疑惑 。 

(3) 重视 网 站 首次 评论 及 从 其 他 渠道 购买 商品 的 
评论 者 。 这 部 分 用 户 的 评论 内 容 通 常 负 面 偏激 ,容易 
引起 其 他 用 户 的 关注 。 

52 ”研究 价值 、 局 限 及 展望 

本 文 主要 贡献 如 下 : 

(1) 关于 评论 有 用 性 研究 的 有 益 补充 。 评 论 的 有 
用 性 投票 有 助 于 其 他 消费 者 快速 找 出 有 助 于 决策 的 评 
论 。 前 人 大 多 是 对 评论 有 用 性 进行 研究 ， 最 终 达 到 对 
没有 投票 的 评论 做 出 有 用 性 预测 ， 从 而 帮助 消费 者 做 
出 更 加 明智 的 购物 决策 。 本 研究 试图 从 为 外 一 个 角度 
为 消费 者 的 购物 决策 做 出 贡献 , 探究 评论 有 用 性 投票 
数 的 影响 因素 有 哪些 。 这 一 研究 视角 对 于 帮助 消费 者 
快速 获得 有 质量 的 信息 非常 有 意义 ， 可 以 帮助 人 们 进 
一 步 了 解 哪些 因素 影响 评论 获得 有 用 性 投票 。 

Q) 利用 零 膨 胀 负 二 项 模型 对 评论 有 用 性 投票 进 
行 研究 , 不 仅 纳入 了 有 投票 的 评论 还 纳入 了 没有 投票 
的 评论 。 采 用 此 种 方法 避免 了 因 样 本 选择 带 来 的 结果 
偏差 . 因而 结果 更 为 准确 ,对 后 续 研 究 具 有 借鉴 意义 。 

本 研究 还 存在 一 些 局 限 : 

(1) 评论 有 用 性 投票 影响 因素 的 研究 样本 选取 的 
是 搜索 品 ， 而 未 对 体验 型 产品 这 一 类 型 进行 探究 。 在 
今后 的 研究 中 , 将 进一步 以 体验 型 产品 为 样本 进行 研 
究 并 对 比 结论 的 差异 。 

(D 在 评论 回复 数 的 处 理 上 , 仪 从 数量 上 分 析 了 
评论 回复 量 与 评论 有 用 性 投票 数 之 间 的 关系 , 而 未 深 
入 分 析 回 复 内 容 及 回复 对 象 对 消费 者 感知 评论 有 用 性 
的 影响 , 这 也 是 今后 研究 的 重点 方向 。 
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Identifying Reviews with More Positive Votes 
Case Study of Amazon.cn 


Wu Jiang Liu Wanwan 
(School of Information Management, Wuhan University, Wuhan 430072, China) 
(The Center of E-commerce Research and Development of Wuhan University, Wuhan 430072, China) 


Abstract: [Objective] This article examines online reviews attracting more positive votes from consumers, aiming to 
identify those high quality reviews based on the information adoption and negative bias theories. [Methods] First, we 
retrieved 12 393 reviews on cellphones from Amazon.cn. Then, we investigated the impacts of the review's 
characteristics on the numbers of positive votes with the help of zero inflated negative binomial regression and text 
analysis methods. The characteristics we studied include reviewer's credibility, review's quality and extremity. [Results] 
The usefulness of the reviewer's previous posting, the information quality of the reviews, the number of comments, the 
extreme ratings, and the negative level of the reviews helped them receive more positive votes. However, the reviewers 
bought the products or not, and the number of the previously posted reviews had negative influence on the number of 
votes. [Limitations] Only investigated cellphones in this study. [Conclusions] This paper helps E-commerce websites 
improve their review ranking algorithms. 


Keywords: Online Review | Online Review Helpfulness Review Vote 


RedLink 5 ORCID 合作 , 将 ORCID 集成 在 最 新 版 Remarq 中 


近日 , RedLink 和 ORCID 达成 一 项 合作 , 计划 将 ORCID 集成 在 最 新 版 的 Remarq 中 ， 当 用 户 使 用 其 ORCID 登录 Remarq 
时 , 将 在 Remarq 中 提供 无 缝 的 ORCID 作者 信息 导入 。 

Remarq 是 一 个 协作 工具 , 提供 注释 、 评 论 、 作 者 更 新 、 编 辑 更 新 、 专 业 联 系 和 文章 共享 等 功能 ， 所 有 这 些 都 在 发 布 商 的 
网 站 上 进行 操作 ,利用 记录 的 不 同 版 本 。Remarq 提供 了 强大 的 平稳 集成 的 系列 工具 , 为 作者 、 编 辑 和 用 户 提供 支持 , 通过 支 
持 他 们 参与 记录 的 不 同 版 本 来 实现 。 

ORCID 为 参与 研究 、 学 术 活 动 和 创新 活动 的 个 人 提供 名 称 标识 符 。 这 些 标识 符 使 得 研究 人 员 、 研究 人 员 的 学 术 产 出 ,以 
及 研究 人 员 所 属 机 构 之 间 的 关系 变 得 透明 和 可 靠 。2017 4E 9 H 14 日 , RedLink 首席 执行 官 Kent Anderson 作为 发 言 人 参与 了 
ORCID 同行 评议 网 络 研 讨 会 。 

Anderson 评论 道 : “我 们 很 高 兴 支 持 ORCID RASA, 同时 也 为 ORCID 标识 符 提供 了 一 个 创新 而 有 趣 的 实用 案例 。 通 
过 ORCID, 研究 人 员 将 能 够 快速 创建 Remarq 的 简介 ,其 中 包括 他 们 的 职业 生涯 亮点 、 出 版 历史 以 及 其 他 重要 的 信息 。” 
除了 与 ORCID 的 集成 外 ,Remardq 的 最 新 升级 还 包括 跟踪 文章 、 作 者 通知 等 。 未 来 团队 还 将 进一步 增强 Remarq 丰富 的 
合作 环境 。 


(编译 自 : https://redlink.com/redlink-announces-integration-with-orcid-in-latest-release-of-remarq/) 
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